☰
16.6.1 대형 멀티모달 모델(LMM)의 등장: GPT-4V, Gemini, Claude의 비전 기능 활용
Home
/
인공지능 (Artificial Intelligence, AI)
/
제목: Embodied AI & Modern Control
/
Chapter 16. 시각-언어 모델과 개방형 어휘 인식 (VLMs & Open-Vocabulary Perception)
/
16.6 로봇 지각을 위한 최신 VLM 아키텍처 및 튜닝
/
16.6.1 대형 멀티모달 모델(LMM)의 등장: GPT-4V, Gemini, Claude의 비전 기능 활용
16.6.1 대형 멀티모달 모델(LMM)의 등장: GPT-4V, Gemini, Claude의 비전 기능 활용